前面介紹了許多ETL、資料前處理與探索式數據分析的方法,今天讓我們回到課程正軌繼續看機器學習的策略與業界應用
講師強調,未來還有很多機會建立各種各樣的機器學習模型,不過重點是希望我們能夠"快速失敗", 失敗為成功之母,目前你走過的坑洞能讓你累積經驗起來,未來在遇到同樣問題時就不會再錯,而這個是在機器學習領域一個很重要的成功關鍵,同樣每個人都要走的路如果你學習的快一點就會快速經歷失敗,這樣就能嘗試更多新方法,進一步獲得成功,這也是讓你比別人快速成長的的關鍵,而我現在也慢慢開始有這種感覺,有時候覺得在做數據分析的過程中無論是做數據前處理或是建立模型,常常都會遇到要讓我動腦思考的問題,這時候就是自我在進步的時候!
一般提到數據的時候會自動聯想到結構化數據,就像存在於資料庫中的整齊的關聯式表格或是像NoSQL這樣的json格式,不過絕大多數的企業所拿到的資料都是非結構化的,像是圖片、影片、音檔、文本、報表等等,如果說我們有一個針對這些資料做預訓練的模型,會幫助你日後做其他應用時更為簡單方便
企業擁有這些資料想要做機器學習相關的加值應用,不外乎是為了讓他們的客戶/消費者能獲得更好的產品或服務品質,所以讓我們思考一下這些遇到的問題背後是什麼原因?原本在業界就有遇到的問題,可能在用機器學習應用之前只能解決部分,如果是用創造性的方式使用機器學習來滿足客戶的需求,像是航班被延誤,或是貨架上想要的商品缺貨,這時候能不能用機器學習來構建一個系統,自動化且快速的填補這些客戶想被滿足的需求,了解這之間的前後關係,並且預測下一步的需求都是機器學習所可以做到的!
講師提到企業可以從機器學習當中受益的三個重點:
今天先介紹到這,明天深入來探討企業個性化推薦的服務